Tính chất Phân phối chuẩn

Một số tính chất của phân phối chuẩn:

  1. Nếu X ∼ N ( μ , σ 2 ) {\displaystyle X\sim N(\mu ,\sigma ^{2})} và a {\displaystyle a} và b {\displaystyle b} là các số thực, thì a X + b ∼ N ( a μ + b , ( a σ ) 2 ) {\displaystyle aX+b\sim N(a\mu +b,(a\sigma )^{2})} (xem giá trị kì vọngphương sai).
  2. Nếu X ∼ N ( μ X , σ X 2 ) {\displaystyle X\sim N(\mu _{X},\sigma _{X}^{2})} và Y ∼ N ( μ Y , σ Y 2 ) {\displaystyle Y\sim N(\mu _{Y},\sigma _{Y}^{2})} là các biến ngẫu nhiên chuẩn độc lập, thì:
    • Tổng của chúng là có phân phối chuẩn với U = X + Y ∼ N ( μ X + μ Y , σ X 2 + σ Y 2 ) {\displaystyle U=X+Y\sim N(\mu _{X}+\mu _{Y},\sigma _{X}^{2}+\sigma _{Y}^{2})} (proof).
    • Hiệu của chúng là có phân phối chuẩn với V = X − Y ∼ N ( μ X − μ Y , σ X 2 + σ Y 2 ) {\displaystyle V=X-Y\sim N(\mu _{X}-\mu _{Y},\sigma _{X}^{2}+\sigma _{Y}^{2})} .
    • Cả hai U {\displaystyle U} và V {\displaystyle V} là độc lập với nhau.
  3. Nếu X ∼ N ( 0 , σ X 2 ) {\displaystyle X\sim N(0,\sigma _{X}^{2})} và Y ∼ N ( 0 , σ Y 2 ) {\displaystyle Y\sim N(0,\sigma _{Y}^{2})} là các biến ngẫu nhiên chuẩn độc lập, thì:
    • Tích của chúng X Y {\displaystyle XY} tuân theo phân phối với hàm mật độ p {\displaystyle p} cho bởi p ( z ) = 1 π σ X σ Y K 0 ( | z | σ X σ Y ) , {\displaystyle p(z)={\frac {1}{\pi \,\sigma _{X}\,\sigma _{Y}}}\;K_{0}\left({\frac {|z|}{\sigma _{X}\,\sigma _{Y}}}\right),} với K 0 {\displaystyle K_{0}} là hàm Bessel được chỉnh sửa loại 2.
    • Tỉ số giữa chúng tuân theo phân phối Cauchy với X / Y ∼ C a u c h y ( 0 , σ X / σ Y ) {\displaystyle X/Y\sim \mathrm {Cauchy} (0,\sigma _{X}/\sigma _{Y})} .
  4. Nếu X 1 , ⋯ , X n {\displaystyle X_{1},\cdots ,X_{n}} là các biến ngẫu nhiên chuẩn tắc độc lập, thì X 1 2 + ⋯ + X n 2 {\displaystyle X_{1}^{2}+\cdots +X_{n}^{2}} có phân phối chi-bình phương với n bậc tự do.

Chuẩn hóa biến ngẫu nhiên có phân phối chuẩn

Một hệ quả của Tính chất 1 là ta có thể quy mọi biến ngẫu nhiên phân phối chuẩn về dạng phân phối chuẩn tắc.

Nếu X {\displaystyle X} ~ N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} , thì

Z = X − μ σ {\displaystyle Z={\frac {X-\mu }{\sigma }}\!}

là một biến có phân phối chuẩn tắc: Z {\displaystyle Z} ~ N ( 0 , 1 ) {\displaystyle N(0,1)} .Từ đó lại dẫn đến một hệ quả quan trọng là hàm phân phối tích lũy của một phân phối chuẩn nói chung sẽ là:

Pr ( X ≤ x ) = Φ ( x − μ σ ) = 1 2 ( 1 + erf ⁡ ( x − μ σ 2 ) ) . {\displaystyle \Pr(X\leq x)=\Phi \left({\frac {x-\mu }{\sigma }}\right)={\frac {1}{2}}\left(1+\operatorname {erf} \left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right).}

Ngược lại, nếu Z {\displaystyle Z} ~ N ( 0 , 1 ) {\displaystyle N(0,1)} , thì

X = σ Z + μ {\displaystyle X=\sigma Z+\mu }

là một biến ngẫu nhiên có phân phối chuẩn với trị trung bình μ {\displaystyle \mu } và phương sai σ 2 {\displaystyle \sigma ^{2}} .

Giá trị của phân phối chuẩn hóa đã được lập thành bảng, và các phân phối chuẩn khác đều là các dạng biến đổi đơn giản từ phân phối chuẩn hóa.Do đó, có thể tra bảng giá trị phân phối tích lũy của hàm phân phối chuẩn hóa để tính các giá trị phân phối tích lũy của phân phối chuẩn.

Mô-men

Một số mô-men bậc nhỏ của phân phối chuẩn:

NumberRaw momentCentral momentCumulant
010
1 μ {\displaystyle \mu } 0 μ {\displaystyle \mu }
2 μ 2 + σ 2 {\displaystyle \mu ^{2}+\sigma ^{2}} σ 2 {\displaystyle \sigma ^{2}} σ 2 {\displaystyle \sigma ^{2}}
3 μ 3 + 3 μ σ 2 {\displaystyle \mu ^{3}+3\mu \sigma ^{2}} 00
4 μ 4 + 6 μ 2 σ 2 + 3 σ 4 {\displaystyle \mu ^{4}+6\mu ^{2}\sigma ^{2}+3\sigma ^{4}} 3 σ 4 {\displaystyle 3\sigma ^{4}} 0

Mọi ước lượng của phân phối chuẩn lớn hơn bậc hai đều bằng zero.

Khởi tạo biến ngẫu nhiên có phân phối chuẩn

Khi mô phỏng bằng máy tính, người ta thường khởi tạo các giá trị số có phân phối chuẩn.Có nhiều cách và cách đơn giản nhất là chuyển ngược bằng hàm phân phối tích lũy chuẩn tắc.Có nhiều phương pháp hiệu quả được dùng đến, một trong chúng là biến đổi Box-Muller.

Biến đổi Box-Muller nhận hai giá trị có phân phối đều làm đầu vào và ánh xạ chúng thành giá trị có phân phối chuẩn.Phương pháp này đòi hỏi phải khởi tạo giá trị từ phân phối đều, và có nhiều phương pháp như vậy. Xem thêm khởi tạo số ngẫu nhiên.

Biến đổi Box-Muller là dựa vào: phân phối chi-bình phương với hai bậc tự do (xem tính chất 4 ở trên) là một biến ngẫu nhiên lũy thừa có thể khởi tạo dễ dàng.

Định lý giới hạn trung tâm

Đồ thị hàm mật độ xác suất của một phân phối chuẩn với μ = 12 và σ = 3, xấp xỉ hàm khối xác suất (pmf) của một phân phối nhị thức với n = 48 và p = 1/4

Phân phối chuẩn có một tính chất rất quan trọng là trong một số trường hợp nhất định, phân phối của tổng rất nhiều biến ngẫu nhiên độc lập sẽ có phân phối xấp xỉ chuẩn.

Đây là định lý giới hạn trung tâm.

Tầm quan trọng thực tiễn của định lý giới hạn trung tâm là phân phối chuẩn có thể được sử dụng như một xấp xỉ cho một số dạng phân phối khác.

  • Một phân phối nhị thức với các tham số n {\displaystyle n} và p {\displaystyle p} được xấp xỉ chuẩn hóa đối với các giá trị lớn của n {\displaystyle n} và p {\displaystyle p} không quá gần 1 hoặc 0 (một số sách đề nghị sử dụng phép xấp xỉ này chỉ khi n p {\displaystyle np} và n ( 1 − p ) {\displaystyle n(1-p)} đều lớn hơn hoặc bằng 5. Trong trường hợp này, cần phải hiệu chỉnh tính liên tục.
  • Một phân phối Poisson với tham số λ {\displaystyle \lambda } được xấp xỉ chuẩn hóa đối với giá trị λ {\displaystyle \lambda } lớn. Phân phối chuẩn được xấp xỉ có trị trung bình μ = λ {\displaystyle \mu =\lambda } và phương sai σ 2 = λ {\displaystyle \sigma ^{2}=\lambda } .

Việc các phép xấp xỉ trên đây có đạt được đủ độ chính xác hay không còn tùy thuộc vào mục đích sử dụng chúng và tốc độ hội tụ về phân phối chuẩn. Thường trong những trường hợp nói trên, độ kém chính xác sẽ xảy ra ở đuôi của đường phân phối.

Khả năng phân chia vô hạn

Phân phối chuẩn có khả năng phân chia vô hạn.

Độ ổn định

Phân phối chuẩn là phân phối xác suất ổn định.

Độ lệch chuẩn

Phần diện tích màu xanh lam thuộc phạm vi một độ lệch chuẩn từ trị trung bình. Đối với phân phối chuẩn, nó chiếm 68% toàn bộ tổng thể trong khi đó phần diện tích nằm trong khoảng 2 lần độ lệch chuẩn (màu xanh và nâu) chiếm 95% và 3 lần độ lệch chuẩn (xanh lam, nâu, lá cây) chiếm 99.7%.

Trong thực nghiệm, ta thường giả thiết rằng dữ liệu lấy từ tổng thể có dang phân phối xấp xỉ chuẩn. Nếu giả thiết này được kiểm chứng thì có khoảng 68% số giá trị nằm trong khoảng 1 độ lệch chuẩn so với trị trung bình, khoảng 95% số giá trị trong khoảng hai lần độ lệch chuẩn và khoảng 99.7% nằm trong khoảng 3 lần độ lệch chuẩn. Đó là "quy luật 68-95-99.7" hoặc quy tắc kinh nghiệm.

Tài liệu tham khảo

WikiPedia: Phân phối chuẩn http://www.danielsoper.com/statcalc/calc02.aspx http://www.sixsigmafirst.com/proba.htm http://mathworld.wolfram.com/NormalDistribution.ht... http://www.elektro-energetika.cz/calculations/no.p... http://socr.stat.ucla.edu/htmls/SOCR_Distributions... http://www.visualstatistics.net/Statistics/Euler/E... http://www.visualstatistics.net/Statistics/Maxwell... http://web.archive.org/19990117033417/members.aol.... http://web.archive.org/19990508224238/members.aol.... http://web.archive.org/19990508225359/members.aol....